Scholar Hub/Chủ đề/#máy học véc tơ hỗ trợ/
Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân l...
Máy học véc tơ hỗ trợ (Support Vector Machine - SVM) là một thuật toán học có giám sát được sử dụng trong lĩnh vực học máy để xây dựng mô hình dự đoán và phân loại. Thuật toán này dựa trên cơ sở ý tưởng tìm kiếm một ranh giới phân chia (đường phân chia) tối ưu giữa các điểm dữ liệu thuộc vào các nhóm khác nhau.
Máy học véc tơ hỗ trợ cố gắng tối đa hoá khoảng cách giữa đường phân chia và các điểm dữ liệu gần nhất, có tên gọi là vector hỗ trợ. Thuật toán sử dụng các phép biến đổi không gian (kernel) để có thể tìm được đường phân chia tối ưu ngay cả khi dữ liệu không phân chia tuyến tính được.
Với tính linh hoạt trong việc xử lý dữ liệu, SVM có thể được áp dụng trong nhiều bài toán khác nhau như phân loại hình ảnh, nhận dạng chữ viết tay, phân loại văn bản, và nhiều ứng dụng khác.
Để hiểu chi tiết hơn về máy học véc tơ hỗ trợ, hãy xem qua các khái niệm và các bước thực hiện cơ bản của thuật toán SVM:
1. Khái niệm căn bản:
- Vector hỗ trợ: Là các điểm dữ liệu gần nhất với đường phân chia (đường biên). Vector hỗ trợ quyết định vị trí và hình dạng của đường phân chia.
- Đường phân chia tối ưu: Là đường thẳng, mặt phẳng, hoặc siêu phẳng trong không gian n chiều, tách hoặc phân chia các điểm dữ liệu thuộc vào các nhóm khác nhau. Mục tiêu của SVM là tìm ra đường phân chia tối ưu có thể phân loại đúng nhưng còn đảm bảo độ tổng quát cao (không bị overfitting).
2. Bước thực hiện cơ bản:
- Chuẩn bị dữ liệu: Dữ liệu huấn luyện (training data) cần được chuẩn bị trước. Mỗi điểm dữ liệu sẽ được biểu diễn dưới dạng véc tơ. Nếu dữ liệu là không phân chia tuyến tính, một phép biến đổi không gian (kernel) sẽ được sử dụng để biến đổi dữ liệu vào một không gian mới có thể phân chia tuyến tính.
- Xây dựng mô hình: Mục tiêu là tìm ra đường phân chia tối ưu. Đường phân chia tối ưu sẽ được xác định bằng cách tìm kiếm đường biên (biên cực đại) sao cho khoảng cách từ đường biên đến các điểm dữ liệu gần nhất là lớn nhất.
- Học mô hình: Thuật toán SVM sẽ tối ưu hóa các thông số của mô hình bằng cách giải một bài toán tối ưu hóa. Mục tiêu là tìm ra các trọng số tối ưu cho mô hình, đồng thời xác định các vector hỗ trợ.
- Dự đoán: Sau khi mô hình đã được huấn luyện, nó có thể được sử dụng để dự đoán nhãn của các điểm dữ liệu mới. Dự đoán dựa trên việc so sánh vị trí của điểm dữ liệu mới với đường phân chia tối ưu đã xác định.
Trên thực tế, thuật toán SVM có thể được tùy chỉnh bằng cách thay đổi các thông số như kernel (linear, polynomial, RBF, sigmoid,...), thông số C (khi xác định độ ràng buộc cho các điểm dữ liệu) và thông số gamma (trong kernel RBF). Những thay đổi này có thể ảnh hưởng đến hiệu suất của mô hình SVM.
Ứng dụng mô hình máy học Véc-tơ tựa (SVM) trong phân tích dữ liệu điểm sinh viênBài báo này đề xuất ứng dụng mô hình kết hợp máy học véc-tơ tựa và hệ thống mờ trong việc trích xuất luật mờ từ dữ liệu điểm sinh viên. Máy học Véc-tơ tựa (SVMs) và hệ thống luật mờ có sự tương đương nhau với một số điều kiện nhất định. Trên cơ sở phân tích sự tương đương giữa mô hình máy học Véc-tơ tựa với mô hình mờ (Fuzzy model), chúng tôi đề xuất một mô hình tích hợp SVMs và Fuzzy model để trí...... hiện toàn bộ
#Máy học véc-tơ tựa #mô hình mờ #khai phá luật kết hợp #khai phá dữ liệu #luật mờ
Đánh giá các thuật toán phân loại trong việc dự đoán những rủi ro về tài chínhRủi ro tài chính luôn là đề tài gây hứng thú cho các nhà nghiên cứu và những nhà đầu tư. Vì vậy, việc dự đoán những rủi ro tài chính trong nền kinh tế hiện nay là cần thiết. Và cách lựa chọn được một hay nhiều lớp phân loại là nhiệm vụ quan trọng. Mục đích bài báo này là sử dụng ba thuật toán phổ biến của phương pháp máy học; máy học vecto hỗ trợ, cây quyết định và thuật toán Naïve Bayes; để dự đo...... hiện toàn bộ
#Rủi ro tài chính #kỹ thuật học máy #máy học vecto hỗ trợ #cây quyết định #Naïve Bayes
Sử dụng lí thuyết tập thô cho việc tạo cấu trúc cây Hah trong phân lớp đa lớpTrong bài báo này, chúng tôi sử dụng chiến lược phân lớp Half- against-Half và bộ phân lớp nhị phân Support Vector Machines (SVMs) cho bài toán phân lớp đa lớp. Trong đó, để tạo cấu trúc cây cho HAH, chúng tôi đề xuất một thuật toán dựa trên lí thuyết...... hiện toàn bộ
#lí thuyết tập thô #Haft-against-Haft #máy học hỗ trợ vector
Mô hình phân loại chất lượng nguồn nước hồ chứa bằng sự kết hợp chiến lược một đối một và bình phương máy học véc tơ hỗ trợMột hệ thống quản lý nguồn nước không hiệu quả có thể trở thành một trong những bất lợi chính cho quá trình phát triển bền vững của loài người. Vì vậy, mô hình phân loại chất lượng nguồn nước tại hồ chứa là rất cần thiết để giải quyết vấn đề môi trường và đây cũng là công cụ hữu ích cho sự cân bằng quá trình ô nhiễm. Bài báo này đề xuất mô hình phân loại chất lượng nguồn nước tại hồ chứa dựa vào s...... hiện toàn bộ
#Hệ thống quản lý #mô hình phân loại #chất lượng nguồn nước hồ chứa #một đối một #bình phương máy học vec-tơ hỗ trợ
Phát hiện lỗi của thép tấm dựa trên sự kết hợp của chiến lược one-against-one và máy học véc tơ hỗ trợPhát hiện lỗi đã trở thành một vấn đề quan trọng đối với ngành công nghiệp sản xuất trong những năm qua. Một hệ thống phát hiện lỗi hiệu quả sẽ thúc đẩy chất lượng sản xuất và giảm chi phí kiểm tra sản phẩm. Bài báo này đề xuất một sự kết hợp của chiến lược one-against-one (OAO) và máy học véc-tơ hỗ trợ (SVM) để phát hiện các lỗi của thép tấm. Chiến lược OAO được sử dụng để hỗ trợ SVMs thực hiện đ...... hiện toàn bộ
#one-against-one #Phát hiện lỗi #máy học véc-tơ hỗ trợ #thép tấm #độ chính xác trong phân loại
MÔ HÌNH HAI GIAI ĐOẠN DỰ ĐOÁN GIÁ CỔ PHIỂU VỚI K-MEANS VÀ FUZZY-SVMBài báo đề xuất một mô hình dự đoán giá cổ phiếu kết hợp K-Means và fuzzy – Support Vector Machines (fuzzy-SVM). Việc trích xuất tập luật mờ từ dữ liệu thô dựa vào sự kết hợp của các mô hình học thống kê chính là cơ sở của mô hình đề xuất. Kiến trúc của mô hình gồm hai giai đoạn, giai đoạn một sẽ áp dụng thuật toán K-means để phân chia không gian dữ liệu đầu vào thành nhiều cụm riêng biệt. Ở giai ...... hiện toàn bộ
#K-Means #dự đoán giá cổ phiếu #mô hình mờ #mô hình mờ hướng dữ liệu; #luật mờ #máy học Véc-tơ hỗ trợ
Phân đoạn Thông tin Đường biên Mờ của Ảnh Dựa trên Thị giác Máy tính và Học Máy Dịch bởi AI Springer Science and Business Media LLC - Tập 21 - Trang 1-15 - 2023
Phân đoạn hình ảnh là một vấn đề then chốt trong lĩnh vực thị giác máy. Mục tiêu cốt lõi của nó là tách biệt mục tiêu và nền trong khu vực quan tâm từ hình ảnh, và ảnh hưởng trực tiếp đến độ chính xác của các phép toán tiếp theo như nhận diện mục tiêu và hiểu hình ảnh. Trong vài thập kỷ qua, đã có nhiều thuật toán phân đoạn hình ảnh tốt. Trong những năm gần đây, phương pháp học sâu đại diện cho họ...... hiện toàn bộ
#Thị giác máy #phân đoạn hình ảnh #học máy #mạng nơ-ron sâu #phân tích cụm #máy vector hỗ trợ.
ỨNG DỤNG MÁY HỌC VECTOR HỖ TRỢ SVM TRONG DỰ ĐOÁN CƠN ĐỘNG KINHBệnh động kinh được xem là căn bệnh liên quan đến rối loạn trong não phổ biến thứ hai và ảnh hưởng đến khoảng 1% dân số thế giới. Đặc trưng của động kinh là sự xuất hiện bất chợt và mất kiểm soát của cơn co giật (cơn động kinh). Trong bài báo này, chúng tôi đề xuất một phương pháp sử dụng máy học ...... hiện toàn bộ
Máy hỗ trợ vector tối thiểu mạnh mẽ dựa trên loại bỏ ngoại lệ hồi quy Dịch bởi AI Soft Computing - Tập 14 - Trang 1241-1251 - 2009
Để đạt được ước lượng vững chắc cho tập dữ liệu nhiễu, một thuật toán máy hỗ trợ vector tối thiểu dựa trên loại bỏ ngoại lệ hồi quy (ROELS-SVM) được đề xuất trong bài báo này. Trong thuật toán này, thông tin thống kê từ các biến lỗi của máy hỗ trợ vector tối thiểu được học tuần tự và một tiêu chí được rút ra từ hồi quy tuyến tính mạnh mẽ được sử dụng cho việc loại bỏ ngoại lệ. Bên cạnh đó, kỹ thuậ...... hiện toàn bộ
#máy hỗ trợ vector #loại bỏ ngoại lệ #hồi quy tuyến tính robust #ước lượng dữ liệu #học máy